Сеть естественных иерархий терминов новостных текстов по событиям «Евромайдана» (Network of Natural Hierarchies of Terms of News Messages on the "Euromaydan" Events)

نویسندگان

  • D. V. Lande
  • A. A. Snarskii
  • Elena Yagunova
چکیده

Построение большой тематической онтологии – сложная и затратная проблема. Определенным этапом разработки общих онтологий является формирование словарных номенклатур, терминологических онтологий. Эффективный автоматический отбор отдельных терминов для таких конструкций на основании неразмеченных текстовых массивов – не решенная окончательно задача [5, 6]. Проблема автоматического установления связей, построения сетей из таких терминов также до сих пор остается открытой. Другой важной задачей является формальная оценка всплеска новых тем в информационных потоках, и, соответственно, терминов, маркирующих эти темы. Сегодня лингвист, работающий с новостными текстами, не может не заинтересоваться спецификой разных современных сегментов (срезов) по данным СМИ, потоков новостных сообщений [4, 8]. В частном случае, по терминам-маркерам можно понимать соответствие отдельных новостных сюжетов тематикам целых информационных потоков, оценивая используемую в них лексику. Ниже описаны подходы к формированию терминологической основы цепочки событий, отражаемых в сообщениях электронных СМИ, а также отдельных сюжетов тематических новостей за определенные временные периоды, а также формирование на основании некоторых принципов языковой сети из отобранных терминов. Соответствие терминологии отдельного событийного сюжета и общей тематической терминологии (или терминологии цепочки связанных событий) можно рассматривать как формальный критерий релевантности данного события и рассматриваемой тематики (цепочки событий). Предварительные этапы формирования языковой сети, связанной с цепочкой взаимосвязанных событий, включают такие шаги: 1. Нахождение релевантных тематике сообщений – формирование корпуса тематических новостных сообщений. 2. Определение динамики тематических сообщений. 3. Определение критических точек (дат) в динамике тематических сообщений. 4. Определение объектов мониторинга (терминов). Рассмотрим их более подробно.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Использование тематических моделей в извлечении однословных терминов (Application of Topic Models to the Task of Single-Word Term Extraction)

В статье представлены результаты экспериментов по применению тематических моделей к задаче извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europarl. Эксперименты показывают, что использование тематической информации значительно улучшает качество извлеч...

متن کامل

Итерационное извлечение шаблонов описания событий по новостным кластерам (Iterative Pattern Extraction Using News Clusters)

В статье описывается метод итерационного формирования шаблонов описания событий по новостным кластерам. Небольшое количество размеченных примеров используется для построения базовых шаблонов, которые обогащаются за счет вариативности описания события в новостных сообщениях близкой тематики. Проведены эксперименты, в которых показана возможность формирования шаблонов для различных типов отношений.

متن کامل

Извлечение низкочастотных терминов из специализированных текстов (Extraction of Low-Frequent Terms from Domain-Specific Texts)

We examined a method for extracting the low frequency important single-word terms from domain specific text. Firstly, domain-relevant fragments were extracted from the text with the help of a dependency tree. Then the fragments were clustered and candidate terms were defined using the semantic classifier. The studies suggest that this approach allows extracting even terms with a single occurrence.

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014